Fouille de graphes sous contraintes linguistiques pour l'exploration de grands textes (Graph Mining Under Linguistic Constraints to Explore Large Texts) [in French]
نویسندگان
چکیده
Graph Mining Under Linguistic Constraints to Explore Large Texts In this paper, we propose an approach to explore large texts by highlighting coherent sub-parts. The exploration method relies on a graph representation of the text according to the Hoey linguistic model which allows the selection and the binding of sentences in the graph. Our contribution relates to using graph mining techniques under constraints to extract relevant subparts of the text (i.e., collections of homogeneous sentence sub-networks). We have conducted some experiments on two large English texts to show the interest of the proposed approach. MOTS-CLÉS : Fouille de graphes, réseaux phrastiques, analyse textuelle, navigation textuelle.
منابع مشابه
Extraction sous contraintes d'ensembles de cliques homogènes
Résumé. Nous proposons une méthode de fouille de données sur des graphes ayant un ensemble d’étiquettes associé à chaque sommet. Une application est, par exemple, d’analyser un réseau social de chercheurs co-auteurs lorsque des étiquettes précisent les conférences dans lesquelles ils publient. Nous définissons l’extraction sous contraintes d’ensembles de cliques tel que chaque sommet des clique...
متن کاملMulti-catégorisation de textes juridiques et retour de pertinence
Résumé. La fouille de données textuelles constitue un champ majeur du traitement automatique des données. Une large variété de conférences, comme TREC, lui sont consacrées. Dans cette étude, nous nous intéressons à la fouille de textes juridiques, dans l’objectif est le classement automatique de ces textes. Nous utilisons des outils d’analyses linguistiques (extraction de terminologie) dans le ...
متن کاملApproche biomimétique coopérative pour la visualisation de grands graphes multidimensionels
Face à la quantité sans cesse grandissante de données stockées, les algorithmes de fouille et de visualisation de données doivent pouvoir être capable de traiter de grandes quantités de données. Une des solutions est d’effectuer un prétraitement des données permettant la réduction de la dimension des données sans perte significative d’informations. L’idée est donc de réduire l’ensemble de descr...
متن کاملPanorama de quelques approches récentes pour la classification non supervisée de graphes
Résumé. Les avancées technologiques récentes ont permis d’acquérir dans de nombreux domaines des corpus de graphes. Une problématique en plein essor consiste à classer ces données complexes pour établir des typologies. Différentes approches développées en fouille de données sont présentées dans cet article: la visualisation de graphes dans une perspective exploratoire, la caractérisation des gr...
متن کاملAnalyse des grands graphes de terrain
Dans de nombreux contextes, il est naturel et pertinent de représenter (une partie de) l’information étudiée sous forme de relations entre objets ; parfois l’information disponible se réduit même essentiellement à un tel ensemble de relations. Dans tous les cas, on se retrouve confronté à des graphes qui ne sont pas issus d’une modélisation mathématisée, mais qui représentent des données réelle...
متن کامل